Nvidia överträffade alla förväntningar på onsdagen och rapporterade skyhöga vinster drivna av deras grafikprocessorer (GPU:er) som utmärker sig på att driva arbetsbelastningar inom artificiell intelligens. Men andra klasser av AI-chip börjar få momentum.
Varje större molnleverantör designar nu sina egna applikationsspecifika integrerade kretsar (ASIC), från Googles TPU till Amazons Trainium till OpenAIs planer med Broadcom. Dessa chip är mindre, billigare, enklare att använda och kan minska dessa företags beroende av Nvidias GPU:er. Daniel Newman från Futurum Group berättade för CNBC att han förväntar sig att ASIC-chip "kommer att växa snabbare än GPU-marknaden under de kommande åren".
Vid sidan av GPU:er och ASIC:er finns det fältprogrammerbara grindmatriser (FPGA), som kan omkonfigureras efter tillverkning för användningsområden som signalbehandling, nätverk och AI. Och det finns en hel generation AI-chips designade för att köras direkt på enheter snarare än via molnet – ett segment som leds av företag som Qualcomm och Apple.
CNBC pratade med experter och insiders på stora teknikföretag för att analysera detta trånga landskap och de olika typerna av AI-chip.
GPU:er för allmän databehandling
Grafikkort användes en gång främst för videospel, men de förvandlade Nvidia till världens mest värdefulla börsnoterade företag när de blev motorn för modern AI. Nvidia levererade ungefär 6 miljoner enheter av sin nuvarande generation "Blackwell"-GPU:er förra året.
Skiftet från spel till AI började 2012, när forskare tränade det neurala nätverket AlexNet med hjälp av Nvidia GPU:er – ett genombrott som många ser som gnistan för den moderna AI-revolutionen. AlexNet tävlade i en uppmärksammad bildigenkänningstävling och förlitade sig på GPU:er snarare än processorer, vilket gav enastående noggrannhet och en stor konkurrensfördel.
Samma parallellbearbetningsförmåga som gör att GPU:er kan rendera verklighetstrogna bilder gör dem också idealiska för att träna djupinlärningsmodeller, som lär sig från data snarare än explicit programmering.
Idag säljs GPU:er till datacentersystem i kombination med processorer för att köra molnbaserade AI-arbetsbelastningar. Processorer har en handfull kraftfulla kärnor för sekventiella uppgifter, medan GPU:er har tusentals mindre kärnor specialiserade på parallella operationer som matrismultiplikation.
Eftersom de kan utföra ett enormt antal operationer samtidigt är GPU:er idealiska för både träning och inferens. Träning lär AI-modeller att hitta mönster i enorma datamängder; inferens använder dessa modeller för att fatta beslut baserat på ny information.
Grafikkort är fortfarande den primära motorn för Nvidia och dess närmaste konkurrent AMD. Programvara är en viktig skillnad mellan dem: Nvidia förlitar sig på sitt CUDA-ekosystem, medan AMD erbjuder en till stor del öppen källkodsstack.
Båda företagen säljer moln-GPU:er till leverantörer som Amazon, Microsoft, Google, Oracle och CoreWeave, som sedan hyr ut datorkraften till AI-utvecklare.
Anthropics avtal på 30 miljarder dollar med Nvidia och Microsoft inkluderar till exempel motsvarande 1 gigawatt datorkapacitet byggd på Nvidia-hårdvara. AMD har nyligen även säkrat stora åtaganden från OpenAI och Oracle.
Nvidia säljer även direkt till regeringar och AI-företag – inklusive minst 4 miljoner GPU:er till OpenAI – och till utländska regeringar som Sydkorea, Saudiarabien och Storbritannien.
Företaget berättade för CNBC att de tar ungefär 3 miljoner dollar per serverkabinett som innehåller 72 Blackwell GPU:er, och att de levererar cirka 1 000 sådana kabinett varje vecka.
Dion Harris, Nvidias senior chef för AI-infrastruktur, sa att han aldrig hade kunnat föreställa sig att efterfrågan skulle växa till den här nivån. ”När vi pratade med företag om ett system med åtta grafikkort för flera år sedan tyckte de att det var överdrivet.”
ASIC:er för specialiserad moln-AI
GPU-baserad träning gav bränsle åt den första vågen av stora språkmodeller, men inferens har blivit allt viktigare i takt med att modellerna mognar. Inferens kan köras på mindre flexibla, billigare chip som är specifikt byggda för vissa matematiska operationer – och det är där ASIC:er kommer in i bilden.
Om en GPU är en "schweizisk armékniv" som kan utföra många olika parallella uppgifter, är en ASIC ett verktyg med ett enda syfte – extremt snabbt och effektivt men låst till en typ av operation när den väl är tillverkad.
”Man kan inte ändra de här chipsen när de väl är etsade i kisel”, säger Chris Miller, författare till *Chip War*. ”Det finns en avvägning mellan effektivitet och flexibilitet.”
Nvidias grafikkort är mångsidiga nog att möta otaliga AI-behov, men de är dyra (upp till 40 000 dollar per enhet) och svåra att få tag på. Startups förlitar sig delvis på dem för att designen av en anpassad ASIC kan kosta tiotals miljoner.
Molnjättar investerar dock kraftigt i ASIC:er eftersom de lovar stora besparingar i stor skala.
”De här företagen vill ha mer kontroll över de arbetsbelastningar de bygger”, sa Newman. ”Men de kommer att fortsätta arbeta med Nvidia och AMD – efterfrågan på datorer är enorm.”
Google var först med att bygga en anpassad AI-ASIC och lanserade Tensor Processing Unit (TPU) 2015. Arbetet påbörjades 2006, men det blev brådskande 2013 när Google insåg att AI kunde fördubbla storleken på sitt datacenter. År 2017 bidrog TPU till att möjliggöra Transformer-arkitekturen som ligger till grund för den mesta moderna AI.
Google avslöjade sjunde generationens TPU i november. Anthropic kommer att träna sin Claude-modell på en miljon TPU:er. Vissa tror att TPU:er konkurrerar med – eller överträffar – Nvidia GPU:er.
"Många förväntar sig att Google så småningom kommer att göra TPU:er tillgängliga i större utsträckning", sa Miller.
AWS följde upp med sina egna chip efter att ha förvärvat Annapurna Labs 2015. De lanserade Inferentia 2018 och Trainium 2022, med Trainium3 som förväntas snart.
Amazon säger att Trainium levererar 30 % till 40 % bättre pris-prestanda än alternativen. Anthropic använder för närvarande en halv miljon Trainium2-chip för att träna sina modeller.
För att bygga anpassade ASIC:er är molnleverantörer beroende av företag som Broadcom och Marvell – som levererar kritisk IP- och nätverksexpertis. ”Det är därför Broadcom har blivit en av de största vinnarna av AI-boomen”, sa Miller.
Broadcom hjälpte till att designa Googles TPU:er och Metas 2023-acceleratorer och bygger anpassade chips för OpenAI med början 2026.
Microsoft har utvecklat Maia 100. Qualcomm har A1200. Intel erbjuder Gaudi-serien. Tesla arbetar på sitt AI5-chip. Startups som Cerebras och Groq driver nya arkitekturer.
I Kina designar Huawei, ByteDance och Alibaba sina egna ASIC:er trots amerikanska exportrestriktioner.
AI på enhetsnivå med NPU:er och FPGA:er
En tredje kategori av AI-chip är byggda för att köra modeller direkt på enheter snarare än via molnet. Dessa chips är vanligtvis integrerade i system-på-ett-chip (SoC)-designer och kallas edge-AI-processorer. De gör att AI-funktioner kan köras lokalt och effektivt, vilket bevarar batteritid och integritet.
”Du kommer att kunna köra AI-uppgifter direkt på din telefon med extremt låg latens”, säger Saif Khan, tidigare AI- och teknikrådgivare i Vita huset. ”Och utan att skicka data till ett datacenter.”
Neurala processorer (NPU:er) är en viktig del av denna kategori, utvecklade av Qualcomm, Intel, AMD och andra.
Apple använder inte termen NPU men bäddar in en "neural motor" i sina Mac-chips i M-serien och sina mobilchips i A-serien.
”Det tillvägagångssättet har visat sig otroligt effektivt”, säger Tim Millet, Apples vice vd för plattformsarkitektur. ”Det är snabbt och ger oss mer kontroll över upplevelsen.”
Snapdragon-chips i Android-telefoner, Samsungs anpassade NPU:er och edge-AI-processorer från NXP och Nvidia driver AI i bilar, robotar, kameror och smarta hem-enheter.
”Det mesta av dagens utgifter går fortfarande till datacenter”, sa Miller. ”Men det kommer att förändras i takt med att AI sprids till telefoner, bilar, wearables och allt annat.”
FPGA:er erbjuder ännu mer flexibilitet eftersom de kan omprogrammeras efter tillverkning, även om de är mindre energieffektiva än ASIC:er eller NPU:er.
AMD blev den största FPGA-tillverkaren efter att ha förvärvat Xilinx för 49 miljarder dollar år 2022. Intel kommer på andra plats efter att ha köpt Altera för 16,7 miljarder dollar år 2015.
Slutsats: Nvidia ligger fortfarande långt före
Alla dessa AI-chipföretag är beroende av en tillverkare: TSMC i Taiwan.
TSMC bygger en massiv tillverkningsanläggning i Arizona, dit Apple kommer att flytta en del av sin produktion. Nvidias VD Jensen Huang sa i oktober att Blackwells grafikkort också har nått "full produktion" där.
Trots den alltmer överbelastade marknaden är det fortfarande extremt svårt att avsätta Nvidia.
”Nvidia är i den här positionen för att de förtjänade den”, sa Newman. ”De har ägnat år åt att bygga upp det här utvecklarekosystemet – och det är de som vann.”
De flesta amerikanska aktieindex steg på fredagen då optimismen kring potentiella räntesänkningar från Federal Reserve återuppstod.
John Williams, chef för New York Fed, sade på fredagen att han förväntar sig att centralbanken kommer att ha mer utrymme att sänka räntorna. Den inflytelserika beslutsfattaren noterade, i ett tal i Chile, att riskerna för arbetsmarknaden nu överväger de som är relaterade till inflationen, vilket återspeglar den mer duvaktiga hållningen hos medlemmarna i FOMC.
Williams sa: ”Jag ser penningpolitiken som fortfarande måttligt restriktiv, men mindre än före våra senaste åtgärder. Så jag fortsätter att se utrymme för en ytterligare justering av målintervallet för styrräntan på kort sikt för att föra politiken närmare neutral nivå och upprätthålla balansen mellan våra två mål.”
I handeln steg Dow Jones Industrial Average med 0,4 % (185 poäng) till 45 937 kl. 16:15 GMT. Det bredare S&P 500 steg med 0,1 % (7 poäng) till 6 545, medan Nasdaq Composite steg med 0,1 % (38 poäng) till 22 040.
Palladiumpriserna fortsatte sin nedgång på fredagen, pressade av en starkare amerikansk dollar, osäkerhet kring efterfrågan och förväntningar om högre utbud.
Reuters rapporterade, med hänvisning till informerade källor, att USA privat pressar Ukraina att acceptera ett eldupphöravtal med Ryssland. En sådan utveckling skulle sannolikt öka den globala tillgången på industrimetaller i takt med att sanktionerna mot Ryssland – en av världens största palladiumexportörer – lättas.
Enligt Capital.com har palladiumpriserna stigit med cirka 26 % sedan början av oktober till ungefär 1 500 dollar per uns. Uppgången kom i takt med vinster på platinamarknaden och en bredare lättnad i de globala finansiella förhållandena.
Satsningar på amerikanska räntesänkningar och tidigare dollarförsvagning har också stöttat palladium som en del av den så kallade "guld + likviditet"-rallyt som har lyft ädelmetallerna de senaste veckorna.
Palladium används nästan uteslutande i katalysatorer för bensinmotorer, vilket innebär att eventuella prisvolatiliteter direkt påverkar kostnadsstrukturerna för amerikanska biltillverkare och elektroniktillverkare.
Teknisk analys från Monex indikerar motstånd mellan 1 500 och 1 520 dollar per uns, med förväntningar om en övergripande hausseartad trend men fortsatt ojämn handel framöver. Analytiker på CPM Group noterade att palladiums senaste styrka är "nära kopplad till platinas utveckling", samtidigt som de varnar för att en sjunkande amerikansk arbetsmarknad och ihållande inflation kan tynga efterfrågan.
Trots en nyligen tillkännagiven handelsvila mellan USA och Kina tyder kommentarer från amerikanska tjänstemän på att spänningarna fortfarande är höga. Den amerikanska finansministern sa att Kina fortfarande är en opålitlig handelspartner, medan president Donald Trump upprepade att hans administration inte kommer att tillåta export av avancerade Nvidia-chips till Kina eller andra länder.
Den amerikanska dollarn steg med 0,1 % till 100,2 klockan 14:43 GMT och handlades mellan högsta nivån 100,4 och lägsta nivån 99,9.
Palladiumterminer för leverans i december sjönk med 0,9 % till 1 374 dollar per uns klockan 14:43 GMT.
Bitcoin föll kortvarigt till 81 871,19 dollar tidigt på fredagen innan det stabiliserades nära 82 460 dollar, en minskning med cirka 10,2 % under de senaste 24 timmarna.
Efter nästan en månad av ihållande försäljning handlas Bitcoin nu 10 % under nivån i början av året, efter att ha raderat ut de flesta av de vinster som gjordes efter Donald Trumps valseger förra året.
Senast Bitcoin sjönk under 82 000 dollar var i april – då det sjönk till 75 000 dollar – under en bred marknadsutförsäljning utlöst av Trumps tillkännagivande om omfattande tullar vid evenemanget "Liberation Day".
Baserat på data från Deribit – options- och terminsbörsen som ägs av Coinbase – rapporterade CoinDesk att handlare positionerar sig för ytterligare nedgång.
Ethereum, den näst största kryptovalutan sett till marknadsvärde, föll under 2 740 dollar, en minskning med mer än 9,6 % under 24 timmar. Andra stora tokens kom också under hårt tryck, där XRP, BNB och SOL sjönk med 9,1 %, 8,4 % respektive 10,6 %. Dogecoin – den största meme-mynten – tappade 10,3 % under samma period.
Efter att ha nått nya rekordnivåer i början av förra månaden har kryptomarknaden utstått stadiga nedgångar efter en exempellös endagskrasch den 10 oktober, då 19,37 miljarder dollar i belånade positioner likviderades på 24 timmar. Händelsen utlöstes av Trumps tillkännagivande om ytterligare 100 % tull på kinesisk import – ett drag han senare backade. Digitala tillgångar har också fångats i bredare marknadsvolatilitet de senaste dagarna, med mer än 2,2 miljarder dollar likviderade under 24 timmar, enligt CoinGlass.
Det totala marknadsvärdet för alla kryptovalutor uppgår nu till 2,92 biljoner dollar, enligt CoinGecko – en minskning med 33 % från toppen på cirka 4,38 biljoner dollar som nåddes i början av oktober. Sedan början av denna månad har Bitcoins börsvärde fallit med cirka 25 %, vilket är den brantaste månatliga nedgången sedan kryptokraschen 2022, enligt Bloomberg.
Aktierna i Strategy (tidigare MicroStrategy) – allmänt sett som en ombudsman för Bitcoin på grund av dess massiva innehav – föll med 2,44 % i förhandeln på fredagen, efter att ha sjunkit med 11 % under den senaste veckan och 41 % under de senaste 30 dagarna. Företaget innehar för närvarande 649 870 BTC till ett genomsnittligt köppris på 74 430 dollar.
I en notis tidigare i veckan varnade JPMorgan-analytiker för att Strategy riskerar att tas bort från stora index som Nasdaq 100 och MSCI USA. En sådan uteslutning skulle kunna driva ytterligare nedgångar i dess aktie och potentiellt tynga kryptomarknaderna om företaget tvingas sälja en del av sina Bitcoin-innehav.